SPSS 散点图教程
作者:Ruben Geert van den Berg,来自 SPSS 图表
一家大型银行希望深入了解员工的工作满意度。他们进行了一项调查,结果保存在 bank_clean.sav 文件中。该调查包括员工每周的工作时数和税前月薪。
研究问题
工作时数与月薪相关似乎是显而易见的:工作时间越长的员工收入越高。但我们想更多地了解这种关系,因此我们的研究问题是:月薪与工作时数之间的关系有多密切?由于我们已经检查过此数据文件(并设置了缺失值),我们可以简单地运行 correlations whours salary.
命令,并看到 相关系数 为 0.648,这是一个相当强的线性关系。有些人可能会就此止步。然而,散点图将表明这种关系远不止于此。
SPSS 散点图创建
我们将首先以大多数用户认为最简单的方式运行散点图:按照下面的屏幕截图进行操作。
上述步骤会生成以下语法。运行它会创建我们的第一个基本散点图。
SPSS 散点图语法
***Minimal scatterplot syntax from legacy dialogs.
**
GRAPH
/SCATTERPLOT(BIVAR)=whours WITH salary
/MISSING=LISTWISE.
注意:运行 graph/scatter whours with salary.
会得到完全相同的结果。如果想要通过复制粘贴编辑语法来创建多个散点图,您可能更喜欢第二个版本。如果想创建大量的散点图,请参阅 SPSS with Python - Looping over Scatterplots。
结果
正如我们所看到的,这并不是一个简单的线性关系。首先,我们看到随着受访者工作时间的增加,我们的点变得更加分散;人们工作的时间越长,月薪的标准差就越大。这是一个典型的 异方差性 (heteroscedasticity) 的例子,与同方差性相反,同方差性是 回归 的一个重要假设。
其次,我们看到点的模式在图表的右侧“向上弯曲”。这清楚地表明了 非线性 (nonlinearity),这也违反了回归假设。
那么,为什么我们在散点图中看到异方差性和非线性?也许更高的时薪只适用于那些职位较高且每周工作时间也较长的人。有趣的是,我们的数据中有“职位类型 (job type)”,这与职位级别有些接近。现在让我们按照下面的屏幕截图将其添加到我们的散点图中。提示:使用对话框调用按钮 可以快速访问散点图对话框。
SPSS 带图例的散点图
“S et Markers by:” 使用不同的颜色来表示我们的点,基于某个变量。我们将输入
jtype
(职位类型)。
“Label C ases by:” 应该用(唯一标识符)变量的值来标记每个点,但它不起作用。无论如何,您可能只想将其用于非常小的样本。如果确实需要它:它确实可以在图表构建器中使用,但我们现在跳过它。我们将使其为空。
可选地,让我们为我们的图表添加一些不错的标题。
SPSS 带图例的散点图语法
***Scatterplot with different colors for different job types.
**
GRAPH
/SCATTERPLOT(BIVAR)=whours WITH salary BY jtype
/MISSING=LISTWISE
/TITLE "Monthly Salary by Weekly Hours | n = 464".
结果
我们得到了它。异方差性和非线性的原因是中高层管理人员的(非常)时薪很高,而且通常比其他员工工作的时间也更长。
此图还表明,我们可能不应该将所有职位类型混为一谈:对于销售员工(红点),工作时间和工资之间的关系看起来非常线性 - 大概是因为他们的时薪相当固定。高层管理人员(黑点)的情况正好相反。现在,我们将通过分别检查每个组的相关性来确认这一点。
各职位类型的单独相关性
***Sort cases needed for split file.
**
sort cases by jtype.
***Split file.
**
split file by jtype.
***Separate correlations for job types.
**
correlations salary with whours.
split file off.
结果
实际上,对于销售员工,工时和工资之间的相关性为 0.79,而对于高层管理人员,该相关性为 0.21。我们将把它作为练习留给读者,以为单独的职位类型组创建散点图。
最后的说明
我们对这些数据的第一个发现只是工作时间和工资之间的相关性为 0.65。然而,散点图表明它并没有那么简单。我希望我们让您了解了如何在 SPSS 中轻松创建散点图,以及为什么它们确实非常有用。感谢您的阅读!